21 クラウドソーシング,つまり,インターネット上で多数の人々に業務を外注するサービスを利用す ることで心理学におけるデータの取り方に革命的な変化が起きています。今回の小特集でその一端 に触れ,新しい時代の息吹を感じてください。 (大久保街亜)
クラウドソーシング
─ 心理学データの新しい姿
クラウドソーシングは,不特定 の人(クラウド)に対して業務を 外部委託(アウトソーシング)す るという意味の造語で,最近注目 を集めている新しい労働市場であ る。そこでは多種多様な仕事がや り取りされ,短時間で簡単にこな せるスキル要求の低い仕事は,特 にマイクロタスクと呼ばれる。 マイクロタスク特化型サービス の代表が,アマゾン社のAmazon Mechanical Turk(MTurk)であ る。元々は,店舗の紹介写真とし て最も良いものを選ぶなどの,コ ンピュータによる自動処理には適 さないが人には容易な小規模な作 業を,少額の報酬で担ってくれる 作業者(ワーカー)を探すという 目的で開発されたサービスであっ たが,学術研究用の参加者プー ルとして利用する試みが拡大して いる。ある調査によると,IF=2.5 以 上 の 学 術 誌 の 中 で MTurkを 用いた論 文数 が,2011年からの 5年間で 約10倍に増 加している (Chandler & Shapiro, 2016)。読者の中には,何となく気には なっていても,そもそもクラウド ソーシングが何なのか,どのよう に使うのかがわからないという方 もいるだろう。本小特集の皮切り として,クラウドソーシングを 使った研究の基本の「き」から始 めてみたい。 クラウドソーシング調査の流れ クラウドソーシング自体は,人 材募集から報酬の支払いまでのプ ロセスをワンストップで実現する サービスであり,タスク,特に調 査・実験は,別の環境を用意して 行うことが多い。十分なスキルが あれば自前のサーバでプログラム を走らせてもよいし,Qualtrics, SurveyMonky 等の調査環境構築 ソフトウェア(リサーチ・スイー ト)もよく使われる(詳細は,本 小特集の伊藤論文を参照)。 クラウドソーシングを用いた調 査では,まずタスク募集を公開 し,応じたワーカーをオンライン 上の調査ページに誘導する。ワー カーには,PCやスマートフォン で回答させ,回答終了時にランダ ムな完了コードを発行する。最後 に,クラウドソーシング側で正し いコードが入力されたことを確認 の後,報酬の支払い処理を行う。 所要時間や回答の困難さなどに よって報酬額は千差万別だが,お よそ数十円〜数百円に設定される ことが多い(報酬額にまつわる問 題については五十嵐論文に詳し い)。また,報酬額の20 〜 40% 程度の委託手数料が徴収されるの が一般的である。 クラウドソーシングの メリット・デメリット クラウドソーシングの利点は, 大規模で多様なサンプルに対する 迅速かつ容易なアクセス,研究遂 行の人的・時間的コストの大幅な 削減,その結果として最終的な成 果発表までの一連の研究サイクル を短時間で完了させることにある (Mason & Suri, 2012)。研究者が データ収集や報酬の支払いのため にどこかに出向く必要はほぼな く,手元のPCでほぼ全てが完結 する(経費精算のための事務処理 の手間はもちろんあるが)。また, 参加者の匿名性を保ちやすく,従 来の対面式調査・実験に比べて個 人情報保護のハードルが相対的に 低いこと,調査項目や制御プログ ラムを公開することで追試が容易 になることも副次的なメリットと して挙げられる。 一方で,クラウドソーシングに も限界はある。まず,サンプル の多様性である。心理学研究で
小特集
クラウドソーシングを使った研究が
気になっているあなたへ
北星学園大学社会福祉学部 准教授眞嶋良全
(まじま よしまさ) Profile─眞嶋良全 2000年,北海道大学大学院文学研究科行動科学専攻博士課程修了。博士(行動科 学)。北海道大学助教,北星学園大学社会福祉学部専任講師を経て現職。専門は認 知心理学(推論,判断)。著書は『心を測る』(分担執筆,八千代出版)など。22 よく使われる「大学生」に比べれ ば,十分に多様であるとはいえ, クラウドソーシングサンプルにも 一定の偏りはある。例えば,ワー カーは20 〜 30歳代が圧倒的に多 い。これは,経済・教育的理由か ら,情報端末の利用とネットアク セスに関するハードルが,この年 齢層で特に低いからだろう。ま た,MTurkワーカーの多くは米 国在住の白人で,近年はインド系 のワーカーも増加しているもの の,人口全体の人種・文化の分布 を代表しているとは言えない。一 方,本邦のクラウドソーシングの ワーカーは大多数が日本人であ る。これは,サービスが提供する インターフェースの言語や,ワー カーに対して報酬を支払う際の決 済システムの制約によると考えら れる(例えば MTurkでは,米国 在住者かインド人ワーカーでない と報酬を金銭で受け取れない)。 また,参加者のナイーブさの問 題もある。例えば,ワーカーは, より多くの報酬を得ようと同一の 課題に何度も参加しようとするか もしれない。リサーチ・スイート やクラウドソーシングのチェック 機能で一定程度は防げるが,同じ ワーカーが異なるIDで参加した 場合や,類似課題を含む別の研究 に参加したワーカーを除くことは 難しい。さらに,ワーカー同士の 情報共有がナイーブさを損なう可 能性もある。しかし,報酬に関す る情報は共有されても,課題内容 がリークされることは稀だとの指 摘もある(Chandler et al., 2014)。 技術面では,回答で使うブラウ ザの制約が挙げられる。例えば, 認知実験で必要なミリ秒単位の刺 激呈示・反応時間の取得は可能だ が,100ms以下の高い精度が必要 な場合は注意が必要である。ま た,リサーチ・スイートではキー 押しの反応時間を測定する機能 までは持っていないことが多く, jsPsych(http://jspsych.org) の ようなライブラリを使ってプログ ラミングするか,Inquisit Webの ような有償のサービスを利用する 必要がある。 他にも,データ・セキュリティ や,インフォームド・コンセン ト,デブリーフィングの難しさな ど,対面型の調査には見られない 新たな配慮事項も存在する(本小 特集の五十嵐論文も参照のこと)。 クラウドソーシングデータの信 頼性と本邦の現状 クラウドソーシングを使った研 究が増えているとはいえ,そこ で得られたデータの信頼性に疑 問を持つのは当然である。しか し,MTurkを中心とした検証研 究では,大学生や年齢がマッチす るオフラインサンプルと同様の結 果を得る,あるいは先行研究の結 果を再現できたことが報告され ており,十分に実用に耐えるこ とが確認されている(Chandler & Shapiro, 2016)。さらに,教示 操作チェック(IMC, 本小特集の 三浦論文も参照されたい) への回 答はワーカーのほうが優れてい るとする結果もある(Hauser & Schwartz, 2016)。 他のクラウドソーシングサー ビスについては,CrowdFlower, ProlificがMTurkと同等かそれ以 上に質の高いサンプルであるこ と(Peer et al., 2017),我々の調 査でも,国内のクラウドソーシン グワーカーが,MTurkと同様の 傾向を示すことが示されている (Majima et al., 2017)。 一 方 で, MTurkで増加しているインド系 のワーカーは,教育経験や誠実さ という点では米国人ワーカーと遜 色ないものの,IMCや反転項目 の回答の質が低下することや,反 応の質が報酬額に影響されること などが指摘されている。また我々 の調査から,PCで回答するほう が携帯端末よりもIMCの成績が 良いことも明らかになっている (Majima et al., 2017; 図1参照)。 クラウドソーシングを使った研 究は,まだ歴史が浅く,未解決の 問題が多数あることは事実である が,この新しいツールを使うこと で,本邦の心理学研究がさらに加 速することを期待している。 文 献
Chandler, J., Mueller, P., & Paolacci, G.(2014) Behav Res, 46 , 112-130. doi:10.3758/s13428-013-0365-7 C h a n d l e r , J . & S h a p i r o , D .
(2016) Annu Rev Clin Psychol, 12 , 53-81. doi:10.1146/annurev-clinpsy-021815-093623
Hauser, D. J. & Schwarz, N. (2016) Behav Res, 48 , 400-407.
doi:10.3758/s13428-015-0578-z Majima, Y., Nishiyama, K., Nishihara,
A., & Hata, R.(2017) Front Psychol, 8:378 . doi: 10.3389/ fpsyg.2017.00378
Mason, W. & Suri, S.(2012) Behav Res, 44 , 1-23. doi:10.3758/s13428-011-0124-6
Peer, E., Brandimarte, L., Samat, S., & Acquisti, A.(2017) J Exp Soc Psychol, 70 , 153-163. doi:10.1016/ j.jesp.2017.01.006
図 1 PC と携帯端末による IMC 通過率の違い。PC のほうが一貫 して高い。